數(shù)據(jù)治理中心 DataArts Studio入門(mén)
數(shù)據(jù)治理中心 DataArts Studio 入門(mén)
一站式數(shù)據(jù)全生命周期管理工具平臺(tái),庫(kù)倉(cāng)湖智全流程治理
一站式數(shù)據(jù)全生命周期管理工具平臺(tái),庫(kù)倉(cāng)湖智全流程治理
3步快速使用數(shù)據(jù)治理中心
3步快速使用數(shù)據(jù)治理中心
註冊(cè)華為雲並實(shí)名認(rèn)證
打開(kāi)華為雲網(wǎng)站,單擊」註冊(cè)「,根據(jù)提示信息完成註冊(cè),註冊(cè)成功後,按指引完成個(gè)人或企業(yè)實(shí)名認(rèn)證。
購(gòu)買(mǎi)並登錄DataArts Studio
DataArts Studio採用基礎(chǔ)包+增量包的計(jì)費(fèi)模式,其中基礎(chǔ)包即DataArts Studio實(shí)例。
創(chuàng)建並管理工作空間
購(gòu)買(mǎi)DataArts Studio實(shí)例的用戶(hù),系統(tǒng)將默認(rèn)為其創(chuàng)建一個(gè)默認(rèn)的工作空間「default」,並賦予該用戶(hù)管理員角色。您可以使用默認(rèn)的工作空間,也可以創(chuàng)建一個(gè)新的工作空間。
十分鐘帶您快速走進(jìn)數(shù)據(jù)治理中心 十分鐘帶您快速走進(jìn)數(shù)據(jù)治理中心
基於電商BI報(bào)表的數(shù)據(jù)開(kāi)發(fā)流程
本實(shí)踐通過(guò)DataArts Studio服務(wù)的數(shù)據(jù)開(kāi)發(fā)DLF組件和數(shù)據(jù)湖探索服務(wù)(DLI)對(duì)某電商商城的用戶(hù)、商品、評(píng)論數(shù)據(jù)(脫敏後)進(jìn)行分析。
基於電影評(píng)分的數(shù)據(jù)集成與開(kāi)發(fā)流程
本實(shí)踐通過(guò)DataArts Studio服務(wù)的數(shù)據(jù)集成CDM組件、數(shù)據(jù)開(kāi)發(fā)DLF組件和數(shù)據(jù)倉(cāng)庫(kù)服務(wù)(DWS)對(duì)電影評(píng)分原始數(shù)據(jù)進(jìn)行分析,輸(shū)出評(píng)分最高和最活躍Top10電影。
基於計(jì)程車(chē)出行的數(shù)據(jù)治理流程
本示例是一個(gè)DataArts Studio全流程入門(mén)教程,旨在介紹如何在DataArts Studio平臺(tái)完成端到端的全流程數(shù)據(jù)運(yùn)營(yíng)。
最佳實(shí)踐
最佳實(shí)踐
通過(guò)數(shù)據(jù)質(zhì)量對(duì)比數(shù)據(jù)遷移前後結(jié)果
數(shù)據(jù)對(duì)帳對(duì)數(shù)據(jù)遷移流程中的數(shù)據(jù)一致性至關(guān)重要,數(shù)據(jù)對(duì)帳的能力是檢驗(yàn)數(shù)據(jù)遷移或數(shù)據(jù)加工前後是否一致的關(guān)鍵指標(biāo)。
通過(guò)數(shù)據(jù)開(kāi)發(fā)實(shí)現(xiàn)數(shù)據(jù)增量遷移
DataArts Studio服務(wù)的DLF組件提供了一站式的大數(shù)據(jù)協(xié)同開(kāi)發(fā)平臺(tái),藉助DLF的在線(xiàn)腳本編輯、周期調(diào)度CDM的遷移作業(yè),也可以實(shí)現(xiàn)增量數(shù)據(jù)遷移。
通過(guò)數(shù)據(jù)開(kāi)發(fā)使用參數(shù)傳遞靈活調(diào)度CDM作業(yè)
當(dāng)CDM作業(yè)接收來(lái)自數(shù)據(jù)開(kāi)發(fā)作業(yè)配置的參數(shù)時(shí),則在數(shù)據(jù)開(kāi)發(fā)模塊可以使用諸如EL表達(dá)式傳遞動(dòng)態(tài)參數(shù)來(lái)調(diào)度CDM作業(yè)。
如何查看表行數(shù)和庫(kù)大小
在數(shù)據(jù)治理流程中,我們常常需要統(tǒng)計(jì)數(shù)據(jù)表行數(shù)或資料庫(kù)的大小。其中,數(shù)據(jù)表的行數(shù)可以通過(guò)SQL命令或數(shù)據(jù)質(zhì)量作業(yè)獲取;資料庫(kù)大小可以直接在數(shù)據(jù)目錄組件中查看。
跨工作空間的DataArts Studio數(shù)據(jù)搬遷
您可以參考本文檔,將原有工作空間的數(shù)據(jù)(包含管理中心數(shù)據(jù)連接、數(shù)據(jù)集成連接和作業(yè)、數(shù)據(jù)架構(gòu)表、數(shù)據(jù)開(kāi)發(fā)腳本、數(shù)據(jù)開(kāi)發(fā)作業(yè)、數(shù)據(jù)質(zhì)量作業(yè)等),搬遷到新建的工作空間中。
通過(guò)CDM節(jié)點(diǎn)批量創(chuàng)建分表遷移作業(yè)
業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)源往往會(huì)採用分表的形式,以減少單表大小,支持複雜的業(yè)務(wù)應(yīng)用場(chǎng)景。在這種情況下,通過(guò)CDM進(jìn)行數(shù)據(jù)集成時(shí),需要針對(duì)每張表創(chuàng)建一個(gè)數(shù)據(jù)遷移作業(yè)。